2025-03-07 14:35:00.AIbase.
Mistral AI lance Mistral OCR, le modèle de reconnaissance de documents le plus puissant : une nouvelle référence en matière de compréhension de documents
2025-02-18 16:55:26.AIbase.
OpenAI lance SWE-Lancer : une nouvelle référence pour évaluer les performances des modèles sur les tâches réelles de freelancing en ingénierie logicielle
2024-12-26 10:54:51.AIbase.
Le grand modèle linguistique Xingchen de China Telecom figure dans le bilan annuel des "joyaux nationaux", établissant une nouvelle référence pour l'IA nationale
2024-12-05 14:45:53.AIbase.
ByteDance lance FullStack Bench, une nouvelle référence pour l'évaluation des grands modèles de code
2024-11-29 09:47:51.AIbase.
En larmes ! Epoch AI lance FrontierMath, une nouvelle référence en mathématiques : les meilleurs modèles d'IA ne résolvent pas plus de 2 % des problèmes
2024-11-25 15:09:04.AIbase.
Meta lance Multi-IF, une nouvelle référence pour évaluer la capacité de suivi d'instructions multilingues et à plusieurs tours
2024-10-31 14:28:43.AIbase.
OpenAI lance SimpleQA, une nouvelle référence pour évaluer la précision factuelle des modèles linguistiques
2024-10-14 14:51:30.AIbase.
L'équipe de recherche d'Apple publie une nouvelle référence GSM-Symbolic : révélant les lacunes du raisonnement mathématique des grands modèles de langage !
2024-10-11 09:35:13.AIbase.